在落地与算法平衡中探寻未来丨2019WAIC开发者大会自然语言处理分论坛圆满落幕
8月31日,由世界人工智能大会组委会主办、小i机器人和人工智能产业创新联盟承办的“开发者大会自然语言处理分论坛”在上海世博中心举行。论坛邀请了复旦大学计算机科学技术学院副教授邱锡鹏、香港科技大学教授张连文、阿里巴巴资深专家孙健、Invoked Apps创始人Nick Schwab及小i机器人副总裁&研究院院长陈成才等多位来自NLP领域的顶尖学者和资深专家,就关于表示学习进展、聚类分析、人机对话交互、语音应用程序的现状等NLP的前沿方向分享了业内最新观点,其中一些颇具前瞻性的观点让在座的观众觉得干货满满,不虚此行。
从Transformer到BERT
复旦大学计算机科学技术学院副教授邱锡鹏博士首先进行了主题为《自然语言处理中的表示学习:从Transformer到BERT》的分享。他提到,最近BERT模型的出现让NLP主流任务都能有非常好的结果,在很多任务场景比如问题回答、阅读理解基本能达到或超越人类平均水平,从主流的模型Transformer到主流的预训练模型BERT,正是这两年飞速发展的领域。
复旦大学计算机科学技术学院副教授邱锡鹏博士
邱锡鹏博士还在现场分享了他们自己的开发工具“FastNLP”:“希望FastNLP能做到像Spacy易用的高级接口和AllenNLP的模块化以及AutoML的自动调参。系统结构非常简单,所有的机器学习模型都相同,每一部分都会提供很多预先实现好的东西,简单的分类示例是通过这模块搭好就可以完成。”
聚类分析的最新进展和应用
来自香港科技大学的张连文教授以《聚类分析的最新进展和应用》为主题,生动详实地阐述了多维度聚类应用。张连文教授介绍了多维度聚类在文本、图像、推荐、问答等系统中的应用,并向大家推荐了相关的应用成果——AIPano,一个对AI领域科研学术人员进行科学研究和论文写作非常有帮助的论文聚类和分析展现系统。
香港科技大学教授张连文博士
未来是双向交互的阶段
来自阿里巴巴达摩院的孙健博士在他的演讲中首先提到,“从传统的交互方式到以人机对话交互非常大的改变就是从原来只能在框里的受限带来的确定性体验,在开放场景里不确定性大大增加。” 孙健博士还提到,未来两年内开放场景下的对话交互能力上界还达不到用户满意度的下界。同时,孙健博士还将企业和客户的交互模式总结为三个阶段:以销售为中心的模式、通过互联网进行单向消息发布、企业和客户可以24小时随时进行双向交互。在他看来,未来正是双向交互的阶段,而当下也正处于第三阶段的早期阶段。
阿里巴巴资深专家 孙健博士
语音应用程序的现状
在本次分论坛中,Invoked Apps创始人Nick Schwab也结合自己创造语音交互APP的历程分享了他关于语音交互领域的研究。
Invoked Apps创始人 Nick Schwab
Nick Schwab创造的语音交互APP在亚马逊Alexa等的平台上都可以通用,他还在亚马逊Alexa、Google开发者平台、三星的Bixby等平台发布了很多其他APP,Nick Schwab也被亚马逊和Google认证为是语音交互领域的领先级人物。
他提到,他的团队在纽约做过一项调查,只有不到5%的人愿意和机器人聊天达到20分钟,大家对语音APP的要求是有更少的对话。“APP话讲少一点,行动多一点,可以帮你解决问题,并且快速提高内容。”
开发者问诊,探寻人工智能的技术与落地
演讲过后,在“开发者问诊”环节中,复旦大学计算机科学技术学院副教授邱锡鹏、香港科技大学教授张连文、阿里巴巴资深专家孙健、Invoked Apps创始人Nick Schwab及小i机器人高级研究员陈培华就关于现场开发者提出的“NLP如何与具体业务场景结合起来并发挥价值”、“文本摘要提取方式”、“NLP学习路线及就业前景”等问题分享了各自的观点。
“现在做人机对话也是先从智能客服开始的,所以紧紧扣住智能客服的需求,将大量业务的知识、对话慢慢沉淀成技术,再把技术用在其他场景中。”在谈到NLP如何与业务场景结合并发挥价值时,孙健谈到,“无论是后续做NLP还是人机对话,最好先从一个行业开始做起,沉淀方法之后再拓展行业会比较好。”
阿里巴巴资深专家 孙健博士
在现场开发者提到关于“文本摘要提取方式”时,小机器人高级研究员陈培华表示,“具体摘要其实分为两大类:抽取式、生成式。目前抽取式可能比较传统一些,比如说分析文章中每个句子权重进行摘要抽取;生成式是基于深度学习的方法更多一些。像这位开发者所提到的后面还有一些时事类、评论类的可能更加接近于文章要素、信息抽取相关的东西。建议还是要针对具体的问题、具体的应用场景、业务数据进行分析。”
小i机器人高级研究员 陈培华博士
在现场开发者最为关心的“NLP学习路线及就业前景”方面,现场嘉宾也给到了非常有价值的建议。Invoked Apps创始人Nick Schwab认为,“现在还是在比较早期的科研阶段,肯定是走在越前端越好。如果是做语音APP而非专业的NLP专家,两个月的时间就够了。”
“学NLP不是看NLP本身,还是看NLP之外的东西。”邱锡鹏表示,“因为本身是要解决和自然语言相关的难题和任务,所以要具备分析问题、解决问题的能力,单纯学NLP一个月也能速成,这不重要,重要的还是代入到具体的应用场景怎么解决问题。”
复旦大学计算机科学技术学院副教授邱锡鹏博士
在“开发者问诊”互动环节中,现场的开发者们还提出了一系列关于自身行业特点的问题,嘉宾们也根据自己的经历和对行业的理解为他们出谋划策,让论坛现场的交流氛围更加热烈。
关注认知智能NLP应用的小i机器人,希望通过本次论坛汇聚各方力量,共同探讨NLP的前沿话题,致力于促进NLP的技术落地和商业落地,让人工智能不再束之高阁,助力行业生态繁荣。
认知智能唤醒行业变革原力,小i机器人多项创新成果亮相2019世界人工智能大会
点击“阅读原文”,进入小i机器人官网了解更多